max rank | avg. rank | sentence |
---|---|---|
183 | 86.4286 | Noticias de Guatemala - Noticias de Guatemala - Noticias. |
214 | 94.3333 | Sin embargo, el estar dentro no lo es todo. |
239 | 118.7143 | “Para nosotros, ha sido un gran cambio. |
262 | 120.0000 | Noticias de Congreso - Noticias de Guatemala - Noticias. |
292 | 124.2857 | Noticias de salud - Noticias de Guatemala - Noticias. |
365 | 123.6000 | Así mismo, indicó que las mujeres son parte importante de los cambios en la sociedad. |
409 | 157.3750 | ¿Qué hacer cuando no se tiene experiencia laboral? |
440 | 89.6667 | El trabajo como un medio para ser mejores personas. |
463 | 113.7000 | Este sector es el de las empresas de comunicación social. |
484 | 116.3000 | Pero no todos están de acuerdo con esta nueva tecnología. |
485 | 186.1250 | Noticias de derechos humanos - Noticias de Guatemala - Noticias. |
525 | 165.4545 | La primera vez fue en abril de 2013 frente al Congreso. |
537 | 127.2222 | Noticias de justicia en Guatemala - Noticias de Guatemala - Noticias. |
552 | 155.2222 | "Si no hay acuerdo, no estamos ante una crisis. |
559 | 250.5556 | Las elecciones del 6 de septiembre se deben realizar. |
567 | 232.8750 | “La empresa no dio respuesta tras la muerte. |
570 | 141.1000 | Lo que se está haciendo es dentro de la ley. |
592 | 166.8750 | Noticias de Ministerio Público - Noticias de Guatemala - Noticias. |
593 | 249.2857 | ¿Qué hacen las mujeres en sus comunidades? |
594 | 155.2727 | Y fue la tarde y fue la mañana: el segundo día. |
595 | 164.1429 | Noticias e información importante sobre este departamento. |
605 | 218.0000 | En su mayoría, con capacidad de pago", indicó. |
619 | 140.7778 | Para ellas, para ellos y para una mejor sociedad. |
623 | 214.3000 | Es el producto final de muchos problemas de salud", explica. |
633 | 208.2727 | No existe en Guatemala ni en la región otro programa igual. |
639 | 267.3333 | Presidente Otto Pérez explicó que "esta con su familia". |
645 | 135.2857 | Hay que tomar en cuenta que Guatemala tiene el apoyo de su gobierno”, dijo. |
660 | 213.8750 | ¿Qué significa para usted el día de hoy? |
662 | 212.3333 | También puede buscar según los productos o los servicios que usted ofrece. |
663 | 202.1429 | Como también, un análisis de los resultados. |
The maximum word rank of a sentence is by definition the rank of the rarest word in the sentence. If it is low, all words in the sentence are of high frequency. For this reason the table of the sentences with least maximum word number might be of interest. In the table, we see the corresponding sentences with a minimum length of 40 characters.
The over all distribution of the maximum rank in all sentences of the corpus is shown in a diagram with log-scaled x-axis.
The sentences in the table described above are of interest because they are usually easy to understand. The distribution may give insights into the corpus and may give parameters for language comparison.
While the distribution might be deduced from a small corpus, the sentences in the table are rare and a large corpus will give more impressive results.
Table data:
select max(w_id)-100 as m, avg(w_id)-100 as a, s.sentence from sentences s, inv_w i where s.s_id=i.s_id and length(sentence)>40 and i.w_id>100 group by s.s_id order by m limit 30;
Distribution data;
select m, count(*) from (select 100* round((max(w_id)-100)/100) as m from sentences s, inv_w i where s.s_id=i.s_id and i.w_id>100 group by s.s_id) aa group by m;
Explain the distribution, especially the increase in its right part.
4.5.2.2 Average word rank in sentence
4.5.2.3 Sentences consisting of many low frequency words I
4.5.2.4 Sentences consisting of many low frequency words II
4.5.2.5 Sentences consisting of short words only I
4.5.2.6 Sentences consisting of short words only II
4.5.2.7 Sentences consisting of long words only I
4.5.2.8 Sentences consisting of long words only II